智能论文笔记

Adaptive and Implicit Regularization for Matrix Completion

Zhemin Li , Tao Sun , Hongxia Wang , Bao Wang

分类：计算机视觉 | 人工智能

2022-08-11

显式低级正则化，例如核规范的正则化已被广泛用于成像科学。但是，已经发现，在各种图像处理任务中，隐式正规化优于明确的正规化。另一个问题是，固定的显式正则化将适用性限制为广泛图像，因为不同的图像偏爱不同的显式正则化捕获的不同特征。因此，本文提出了一种新的自适应和隐式低级别正则化，从训练数据中动态捕获了较低的先验。我们新的自适应和隐式低级别正则化的核心是在基于Dirichlet Energy的正则化中参数化Laplacian矩阵，我们称之为正则化空气。从理论上讲，我们表明\ retwo {air}的自适应正则化增强了训练结束时的隐式正则化和消失。我们验证了空气对各种基准任务的有效性，表明空气对缺失条目不均匀的情况特别有利。该代码可以在https://github.com/lizhemin15/air-net上找到。

translated by 谷歌翻译

Single Stage Virtual Try-on via Deformable Attention Flows

Shuai Bai , Huiling Zhou , Zhikang Li , Chang Zhou , Hongxia Yang

分类：计算机视觉

2022-07-19

虚拟试验旨在在店内服装和参考人员图像的情况下产生光真实的拟合结果。现有的方法通常建立多阶段框架来分别处理衣服翘曲和身体混合，或严重依赖基于中间解析器的标签，这些标签可能嘈杂甚至不准确。为了解决上述挑战，我们通过开发一种新型的变形注意流（DAFLOF）提出了一个单阶段的尝试框架，该框架将可变形的注意方案应用于多流量估计。仅将姿势关键点作为指导，分别为参考人员和服装图像估计了自我和跨跨性别的注意力流。通过对多个流场进行采样，通过注意机制同时提取并合并了来自不同语义区域的特征级和像素级信息。它使衣服翘曲和身体合成，同时以端到端的方式导致照片真实的结果。在两个尝试数据集上进行的广泛实验表明，我们提出的方法在定性和定量上都能达到最先进的性能。此外，其他两个图像编辑任务上的其他实验说明了我们用于多视图合成和图像动画方法的多功能性。

translated by 谷歌翻译

Cross-domain User Preference Learning for Cold-start Recommendation

Huiling Zhou , Jie Liu , Zhikang Li , Jin Yu , Hongxia Yang

分类：机器学习

2021-12-07

跨域冷启动推荐是推荐系统越来越新兴的问题。现有的作品主要专注于解决跨域用户推荐或冷启动内容推荐。但是，当新域在早期发展时，它具有类似于源域的潜在用户，但互动较少。从源域中学习用户的偏好并将其转移到目标域中是至关重要的，特别是在具有有限用户反馈的新到达内容上。为了弥合这一差距，我们提出了一个自训练的跨域用户偏好学习（夫妻）框架，针对具有各种语义标签的冷启动推荐，例如视频的项目或视频类型。更具体地，我们考虑三个级别的偏好，包括用户历史，用户内容和用户组提供可靠的推荐。利用由域感知顺序模型表示的用户历史，将频率编码器应用于用于用户内容偏好学习的底层标记。然后，建议具有正交节点表示的分层存储器树以进一步概括域域的用户组偏好。整个框架以一种对比的方式更新，以先进先出（FIFO）队列获得更具独特的表示。两个数据集的广泛实验展示了用户和内容冷启动情况的夫妇效率。通过部署在线A / B一周测试，我们表明夫妇的点击率（CTR）优于淘宝应用程序的其他基线。现在该方法在线为跨域冷微视频推荐服务。

translated by 谷歌翻译

Morphology Decoder: A Machine Learning Guided 3D Vision Quantifying Heterogenous Rock Permeability for Planetary Surveillance and Robotic Functions

Omar Alfarisi , Aikifa Raza , Djamel Ouzzane , Hongxia Li , Mohamed Sassi , Tiejun Zhang

分类：计算机视觉 | 机器学习

2021-11-26

渗透性对天然液的流动性具有显性影响。格子Boltzmann模拟器确定纳米和微孔网络的渗透率。模拟器占据了数百万的流动动态计算，其累积的误差和高耗电量的计算能力。为了有效且始终如一地预测渗透性，我们提出了一种形态学解码器，从3D微型计算机层面扫描和核磁共振图像中提出了机器学习的平行和串行流量重建。对于3D视觉，我们将可控可测量的卷引入新的监督分段，其中一组独特的体素强度对应于晶粒和孔喉部尺寸。形态解码器以新颖的方式贬低并汇集形态边界以产生渗透性。形态学解码器方法由五种新方法组成，其中描述了本文，这些新方法是：（1）几何3D渗透率，（2）机器学习引导3D特性识别岩石形态，（3）3D图像特性集成模型的渗透率（4）MRI渗透成像器，（5）形态解码器（整合其他四个新颖过程的过程）。

translated by 谷歌翻译

AIR-Net: Adaptive and Implicit Regularization Neural Network for Matrix Completion

Zhemin Li , Tao Sun , Hongxia Wang , Bao Wang

分类：机器学习 | (统计)机器学习

2021-10-12

明确的低级正则化，例如核规范规则，已广泛用于成像科学。但是，已经发现隐式正则化优于各种图像处理任务中的明确正则化。另一个问题是，固定的显式正则化将适用性限制为广泛的图像，因为不同的图像有利于使用不同的显式规则化捕获的不同特征。因此，本文提出了一种新的自适应和隐式低级正则化，其从训练数据动态地捕获低秩。在我们新的自适应和隐式低级正则化的核心，正在使用神经网络参数化Laplacian矩阵，并通过神经网络调用所提出的型号\ Textit {Air-Net}。从理论上讲，我们表明，空气网的自适应正规化增强了隐含的正则化并在培训结束时消失。我们验证了对各种基准任务对各种基准任务的效果，显示空中网对缺失条目不均匀时的情况尤为好评。可以在\ href {https://github.com/lizhemin15/airair-net}} {https：//github.com/lizhemin15/airair-net}。

translated by 谷歌翻译

M6-UFC: Unifying Multi-Modal Controls for Conditional Image Synthesis

Zhu Zhang , Jianxin Ma , Chang Zhou , Rui Men , Zhikang Li , Ming Ding , Jie Tang , Jingren Zhou , Hongxia Yang

分类：计算机视觉

2021-05-29

条件图像合成旨在根据文本描述，参考图像和图像块的形式创建图像，以保存的，以及它们的组合。在本文中，我们提出了一个新的两级架构M6-UFC，统一了任何数量的多模态控件。在M6-UFC中，各种控制信号和合成图像都均匀地表示为由变压器处理的离散令牌序列。与现有的两级自回归方式不同，如Dall-E和VQGAN，M6-UFC在第二阶段采用非自动发作生成（NAR），以增强合成图像的整体一致性，以支持保留指定的图像块，以及提高合成速度。此外，我们设计了一种逐步算法，其迭代地改善了非自动产生的图像，其中包括用于评估符合控制的符合和评估合成图像的保真度的两个估计器的帮助。在新收集的大型服装数据集M2C时装和面部数据集多模态Celeba-HQ上进行了广泛的实验验证了M6-UFC可以合成符合灵活的多模态控制的高保真图像。

translated by 谷歌翻译

Contrastive Attraction and Contrastive Repulsion for Representation Learning

Huangjie Zheng , Xu Chen , Jiangchao Yao , Hongxia Yang , Chunyuan Li , Ya Zhang , Hao Zhang , Ivor Tsang , Jingren Zhou , Mingyuan Zhou

分类：机器学习 | 计算机视觉 | (统计)机器学习

2021-05-08

对比度学习（CL）方法有效地学习数据表示，而无需标记监督，在该方法中，编码器通过单VS-MONY SOFTMAX跨透镜损失将每个正样本在多个负样本上对比。通过利用大量未标记的图像数据，在Imagenet上预先训练时，最近的CL方法获得了有希望的结果，这是一个具有均衡图像类的曲制曲线曲线集。但是，当对野外图像进行预训练时，它们往往会产生较差的性能。在本文中，为了进一步提高CL的性能并增强其对未经保育数据集的鲁棒性，我们提出了一种双重的CL策略，该策略将其内部查询的正（负）样本对比，然后才能决定多么强烈地拉动（推）。我们通过对比度吸引力和对比度排斥（CACR）意识到这一策略，这使得查询不仅发挥了更大的力量来吸引更遥远的正样本，而且可以驱除更接近的负面样本。理论分析表明，CACR通过考虑正/阴性样品的分布之间的差异来概括CL的行为，而正/负样品的分布通常与查询独立进行采样，并且它们的真实条件分布给出了查询。我们证明了这种独特的阳性吸引力和阴性排斥机制，这有助于消除在数据集的策划较低时尤其有益于数据及其潜在表示的统一先验分布的需求。对许多标准视觉任务进行的大规模大规模实验表明，CACR不仅在表示学习中的基准数据集上始终优于现有的CL方法，而且在对不平衡图像数据集进行预训练时，还表现出更好的鲁棒性。

translated by 谷歌翻译

Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic Learning

Yu Wang , Hongxia Jin

分类：自然语言处理

2022-12-20

A coreference resolution system is to cluster all mentions that refer to the same entity in a given context. All coreference resolution systems need to tackle two main tasks: one task is to detect all of the potential mentions, and the other is to learn the linking of an antecedent for each possible mention. In this paper, we propose a hybrid rule-neural coreference resolution system based on actor-critic learning, such that it can achieve better coreference performance by leveraging the advantages from both the heuristic rules and a neural conference model. This end-to-end system can also perform both mention detection and resolution by leveraging a joint training algorithm. We experiment on the BERT model to generate input span representations. Our model with the BERT span representation achieves the state-of-the-art performance among the models on the CoNLL-2012 Shared Task English Test Set.

translated by 谷歌翻译

Neural Coreference Resolution based on Reinforcement Learning

Yu Wang , Hongxia Jin

分类：自然语言处理

2022-12-18

The target of a coreference resolution system is to cluster all mentions that refer to the same entity in a given context. All coreference resolution systems need to solve two subtasks; one task is to detect all of the potential mentions, and the other is to learn the linking of an antecedent for each possible mention. In this paper, we propose a reinforcement learning actor-critic-based neural coreference resolution system, which can achieve both mention detection and mention clustering by leveraging an actor-critic deep reinforcement learning technique and a joint training algorithm. We experiment on the BERT model to generate different input span representations. Our model with the BERT span representation achieves the state-of-the-art performance among the models on the CoNLL-2012 Shared Task English Test Set.

translated by 谷歌翻译

A Robust Semantic Frame Parsing Pipeline on a New Complex Twitter Dataset

Yu Wang , Hongxia Jin

分类：自然语言处理 | 人工智能

2022-12-18

Most recent semantic frame parsing systems for spoken language understanding (SLU) are designed based on recurrent neural networks. These systems display decent performance on benchmark SLU datasets such as ATIS or SNIPS, which contain short utterances with relatively simple patterns. However, the current semantic frame parsing models lack a mechanism to handle out-of-distribution (\emph{OOD}) patterns and out-of-vocabulary (\emph{OOV}) tokens. In this paper, we introduce a robust semantic frame parsing pipeline that can handle both \emph{OOD} patterns and \emph{OOV} tokens in conjunction with a new complex Twitter dataset that contains long tweets with more \emph{OOD} patterns and \emph{OOV} tokens. The new pipeline demonstrates much better results in comparison to state-of-the-art baseline SLU models on both the SNIPS dataset and the new Twitter dataset (Our new Twitter dataset can be downloaded from https://1drv.ms/u/s!AroHb-W6_OAlavK4begsDsMALfE?e=c8f2XX ). Finally, we also build an E2E application to demo the feasibility of our algorithm and show why it is useful in real application.

translated by 谷歌翻译